원-핫 인코딩 [Aiffel] 아이펠 53일차 개념 정리 및 회고 BoW 전처리: 불필요한 단어 제거, 표현은 다르지만 같은 단어 통합 희소벡터: 대부분의 값이 0인 벡터 ex) 자주 사용되지만 의미가 없는 the와 같은 단어를 처리하기 위해 단어마다 가중치를 다르게 주는 방법이 등장함 DTM, TF-IDF 공통점, 차이점 문서 벡터 크기 = 단어장의 크기 단어 벡터 간 유사도 구할 수 없음 대안: 워드 임베딩 5) 워드 임베딩 벡터의 길이를 일정하게 정해... 원-핫 인코딩원-핫 인코딩 원-핫 인코딩(One-hot encoding) - 전처리 원-핫 인코딩이란 카테고리별로 이진 특성을 만들어 해당하는 특성만 1, 나머지는 0으로 만드는 방법이다. 주로 범주형 데이터에서 많이 이용된다. ex) 국가명, 시.도, 장르 여기서 사용할 vgsales 데이터는 비디오게임 매출 데이터이다. pandas에서 get_dummies 함수를 통해 손쉽게 원-핫 인코딩을 할 수 있다. pd.concat 함수로 원래 DataFrame과 새로운 Data... PreprocessingOne-Hot Encoding원-핫 인코딩pandas전처리One-Hot Encoding [Aiffel] 아이펠 6일차 개념 정리 및 회고 data.loc[행라벨, 열 라벨]: 해당 라벨을 가진 데이터를 추출 1) 클래스: 프로그래밍에서 객체를 만들 때 사용 인스턴스 속성, 인스턴스 메소드가 필요없을 때 사용. 정적 메소드와 같이 인스턴스 없이 호출 가능 다만 클래스 속성, 클래스 메소드에 접근해야할 때 사용 (2) 결측치가 있는 열 측정 방법 (3) 결측치가 있는 열 삭제 방법 (4) 결측치가 있는 행 측정 방법 ⇒ isnul... 원-핫 인코딩인공지능데이터전처리판다스정규화결측치이상치범주형 데이터수치형 데이터객체지향데이터국비교육구간화아이펠객체지향
[Aiffel] 아이펠 53일차 개념 정리 및 회고 BoW 전처리: 불필요한 단어 제거, 표현은 다르지만 같은 단어 통합 희소벡터: 대부분의 값이 0인 벡터 ex) 자주 사용되지만 의미가 없는 the와 같은 단어를 처리하기 위해 단어마다 가중치를 다르게 주는 방법이 등장함 DTM, TF-IDF 공통점, 차이점 문서 벡터 크기 = 단어장의 크기 단어 벡터 간 유사도 구할 수 없음 대안: 워드 임베딩 5) 워드 임베딩 벡터의 길이를 일정하게 정해... 원-핫 인코딩원-핫 인코딩 원-핫 인코딩(One-hot encoding) - 전처리 원-핫 인코딩이란 카테고리별로 이진 특성을 만들어 해당하는 특성만 1, 나머지는 0으로 만드는 방법이다. 주로 범주형 데이터에서 많이 이용된다. ex) 국가명, 시.도, 장르 여기서 사용할 vgsales 데이터는 비디오게임 매출 데이터이다. pandas에서 get_dummies 함수를 통해 손쉽게 원-핫 인코딩을 할 수 있다. pd.concat 함수로 원래 DataFrame과 새로운 Data... PreprocessingOne-Hot Encoding원-핫 인코딩pandas전처리One-Hot Encoding [Aiffel] 아이펠 6일차 개념 정리 및 회고 data.loc[행라벨, 열 라벨]: 해당 라벨을 가진 데이터를 추출 1) 클래스: 프로그래밍에서 객체를 만들 때 사용 인스턴스 속성, 인스턴스 메소드가 필요없을 때 사용. 정적 메소드와 같이 인스턴스 없이 호출 가능 다만 클래스 속성, 클래스 메소드에 접근해야할 때 사용 (2) 결측치가 있는 열 측정 방법 (3) 결측치가 있는 열 삭제 방법 (4) 결측치가 있는 행 측정 방법 ⇒ isnul... 원-핫 인코딩인공지능데이터전처리판다스정규화결측치이상치범주형 데이터수치형 데이터객체지향데이터국비교육구간화아이펠객체지향